
谷歌 DeepMind 產品副總裁 Tulsee Doshi 強調人工智慧未來發展繫於使用者信任,必須著重模型安全與負責任的互動。在 Anthropic 推出新模型後,《華盛頓時報》社論也呼籲國會加強 AI 監管以應對潛在風險。
谷歌 DeepMind 產品副總裁 Tulsee Doshi 指出,人工智慧(AI)的下一階段發展,將關鍵取決於使用者對其信任程度。隨著 AI 技術不斷演進,以及如 Gemini 這類模型的應用日益深入使用者日常生活,確保模型的安全性與負責任的互動變得至關重要。
Doshi 在一份聲明中提到,現今評估 AI 模型不再僅限於傳統的危害判斷,更需考量模型是否會出現「諂媚」行為以及代理人安全等因素。她強調,如何在模型「拒絕回應」(blank response rate)與提供細膩但可能「過度」的回應之間取得平衡,是業界持續努力的目標。個人而言,她對於選擇不回答問題的代理人感到更為安心。谷歌正積極投入資源塑造其模型的「人格特質」,並將根據使用者回饋持續優化,以適應 Gemini 進入「代理人時代」後,與使用者共同行動及為使用者服務的角色轉變,同時建立完善的防護措施以應對使用者操作。
另一方面,先進 AI 模型的快速問世也引發社會對監管的關注。《華盛頓時報》於本月 21 日發表社論,題為「國會必須立即處理先進人工智慧」。社論特別提及 Anthropic 公司在 4 月發布的 Claude Mythos Preview 模型,稱其為有史以來最強大的人工智慧模型之一,並呼籲美國國會應採取行動,應對先進 AI 模型所帶來的潛在風險。業界普遍認為,重大前沿模型的發布,往往會將公眾與政策制定者的討論從單純的研究基準,轉移至部署風險、安全測試與治理框架等更為實際的層面。
在此背景下,美國國會也正致力於 AI 相關立法。美國參議員泰德·巴德(Ted Budd)便領導跨黨派參議員小組,共同提出 FARM AI Act,旨在擴大美國農民取得 AI 科技的機會。這些來自業界領導者和政策制定者的呼籲與行動,皆顯示建立健全的 AI 治理框架,以贏得並維護使用者信任,已成為人工智慧未來發展的當務之急。
